Apprentissage de signatures de facteurs de transcription à partir de données d'expression
نویسندگان
چکیده
Résumé. L’inférence de signatures de facteurs de transcription à partir des données puces à ADN a déjà été étudié dans la communauté bioinformatique. La principale difficulté à résoudre est de trouver un ensemble d’heuristiques pertinentes, afin de contrôler la complexité de résolution de ce problème NP-difficile. Nous proposons dans cet article une solution heuristique alternative à celles utilisées dans les approches bayésiennes, fondée sur la recherche de motifs fréquents maximaux dans une matrice discrétisée issue des données numériques de puces ADN. Notre méthode est appliquée sur des données de cancer de vessie de l’Institut Curie et de l’Hôpital Henri Mondor de Créteil.
منابع مشابه
Apprentissage de la structure des réseaux bayésiens à partir des motifs fréquents corrélés : application à l'identification des facteurs environnementaux du cancer du Nasopharynx
Résumé. L’apprentissage de structure des réseaux bayésien à partir de données est un problème NP-difficile pour lequel de nombreuses heuristiques ont été proposées. Dans cet article, nous proposons une nouvelle méthode inspirée des travaux sur la recherche de motifs fréquents corrélés pour identifier les causalités entre les variables. L’algorithme opère en quatre temps : (1) la découverte par ...
متن کاملCombinaison de sources de données pour l'amélioration de la prédiction en apprentissage : une application à la prédiction de la perte de poids chez l'obèse à partir de données transcriptomiques et cliniques
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملLarge-scale acoustic and prosodic investigations of french. (Analyses acoustiques et prosodiques du français à partir de grandes masses de données orales)
ii This thesis was partially financed by RTRA-DIGITEO, Région Île-de-France, under the projet AMADEO (Apprentissage à partir de grandes masses de données orales, 2007-01D), and by the OSEO Quaero program.
متن کاملApprentissage relationnel de motifs temporels
Résumé. Nous présentons deux expériences d’apprentissage relationnel de motifs temporels comportant des contraintes numériques des chroniques à partir de séries temporelles. La première concerne l’apprentissage d’arythmies cardiaques à partir d’électrocardiogrammes. La deuxième réalise l’apprentissage de règles prédisant la dégradation de la qualité de service dans un réseau de télécommunicatio...
متن کاملApprentissage de structure des réseaux bayésiens et données incomplètes
Résumé. Le formalisme des modèles graphiques connait actuellement un essor dans les domaines du machine learning. En particulier, les réseaux bayésiens sont capables d’effectuer des raisonnements probabilistes à partir de données incomplètes alors que peu de méthodes sont actuellement capables d’utiliser les bases d’exemples incomplètes pour leur apprentissage. En s’inpirant du principe de ams-...
متن کامل